home *** CD-ROM | disk | FTP | other *** search
/ InfoMagic Internet Tools 1995 April / Internet Tools.iso / infoserv / www / cern / doc / www-talk.archive.Z / www-talk.archive / text0057.txt < prev    next >
Encoding:
Text File  |  1992-11-30  |  5.6 KB  |  153 lines

  1. > Date: Thu, 27 Feb 92 19:45:42 -0500
  2. > From: jcurran@nnsc.nsf.net
  3.  
  4. >Even if the exact scheme is not used, the requirement
  5. > discussion contained in the paper is quite valuable.
  6. > I have a few comments:
  7.  
  8. >] Terms
  9. >]
  10. >] The objects on the network which are to be named include
  11. >] objects which can be retrieved, and objects which can be searched.
  12.  
  13. > Using this definition, one would infer that document identifiers
  14. > would allow reference to a distinct file, a particular mail
  15. > message, news article, etc. I would not anticipate that a document
  16. > identifier would be used to identify a newsgroup, interactive
  17. > service, archive directory , or a wais source.  Are  we trying to
  18. > define a universal id or a universal document id?  Might it be
  19. > better to defer the definition of non-document resources and then
  20. > come back and make the document specific id's be a subset of a
  21. > future general resource identifier?
  22.  
  23. You are right that the UDIs were inteneded to be able to refer to any  
  24. of those things. (In the W3 world, they all look pretty similar  
  25. anyway -- they are all represented as [hyper]text objects.)  It is  
  26. largely in order to be able to make references to any of those things  
  27. that we need a UDI rather than a WAIS-DI and a W3-DI and a news-DI  
  28. etc etc.  A UDI allows references between systems, and expandability  
  29. for the future.  My answer would be that we are trying to define a  
  30. universal document id, but where "document" has the very wide  
  31. interpretation as any data which can be retrieved, viewed or  
  32. searched: anything to which you might want to make a reference.
  33. For example, a person is not a document (although to have a document  
  34. on the net representing each person might be useful... their  
  35. signature/disclaimer with links to their published works, etc etc.)  
  36. If we can't cope with the objects which are on the net now, how can  
  37. we hope to cope with the wierd things to come .. video clips from the  
  38. news last night etc...
  39.  
  40.  
  41. ] Relevance
  42.  
  43. ] The life of a name is limited by any information contained within  
  44. it which 
  45.  
  46. ] may become prematurely invalid. It is therefore necessary to limit  
  47. the 
  48.  
  49. ] contents of a name to the information required for the operations  
  50. above. 
  51.  
  52. ] Other extraneous information about the document (its size, data  
  53. format, 
  54.  
  55. ] authorization details, etc) may in general change with time and  
  56. should 
  57.  
  58. ] not be part of the name.
  59.  
  60. > The proposed document identifiers have many characteristics which 
  61.  
  62. > may change with time: storage location, access protocol, format, 
  63.  
  64. > etc. If we focus instead on the "information content" of a \
  65. > document, then it might be possible to form identifiers that are
  66. >  more robust.  Many people consider:
  67. >
  68. > file://info.cern.ch./pub/www/doc/udi1.ps      and 
  69.  
  70. > file://info.cern.ch./pub/www/doc/udi1.txt
  71. >
  72. > to be the same document; just in different formats.
  73.  
  74. Precisely. We look forward to the day when a name like
  75.  
  76.     x500:/CH/CERN/CN/TBL/TechNote-15
  77.  
  78. will be put through a name server which will return a set of  
  79. addresses. In the mean time, we don't have that ubiquitous name  
  80. server (directory) facility. So we have to make do with physical  
  81. addresses. And different versions of the same document look like  
  82. different documents. Its a shame. The plan is that UDIs can migrate  
  83. from physical addresses to registered names.
  84.  
  85.  
  86.  
  87. > It would be nice to be able to recognize this
  88. > and allow  the user (and user interface) to determine which
  89. > instance should be used for retreival.
  90.  
  91. Yes. Absolutely.  (The neatest way is for the client to send a set of  
  92. preferences over with the request, and for the server to decide which  
  93. to format to send. This is a suggestion for an evolved wais and/or  
  94. http protoccol.) Another way if for the client to ask a name server  
  95. for addresses, and retrieve the headers of each one to find out which  
  96. representation he'd prefer -- But I'd prefer all the represenattions  
  97. of the document to have the same name right down to the retrieval  
  98. protocol level.
  99.  
  100. > This recognition may only
  101. > be perform if the document id's (now being used document content
  102. > ids) contain only location and format independant data.  It is easy
  103. > to imagine that uniqueness could be assured by combining
  104. > an organization, author, and title:
  105. >
  106. >
  107. > cern.ch:www-staff:udi1 
  108.  
  109. >
  110. > ietf:osids:archdirectory-00 
  111.  
  112.  
  113. There are two functions: One, to find out whethre two documents are  
  114. the same. Two, to derive a (set of) addresses for retrieval of the  
  115. document. To be able to do the first, any unique id (like OSF/DCE  
  116. UUIDs or RFCxxxx message ids) will work. To be able to do the second,  
  117. a directory service is needed.
  118.  
  119. > Note that the actual location of the information might be far
  120. > removed from the point of creation, and the format might be
  121. > changed:
  122. >
  123. >cern.ch:www-staff:udi1;file://ftp.uu.net/doc/univeral-docids.PS.Z
  124. >cern.ch:www-staff:udi1;news:<1992Feb21.121919.1@quake.think.com>
  125. >cern.ch:www-staff:udi1;wais://nnsc.nsf.net/info-retrieval-notes?udi1
  126.  
  127. I see the usefulness of quoting both the unique identifier and the  
  128. physical address. I hope that in the future, though, one will only  
  129. need the first part "cern.ch:www-staff:udi1". That, fed into the  
  130. directory service, will produce a list of addresses.
  131.  
  132. You can, of course, still quote both: "You need document  
  133. x500:/cern.ch/www-staff/udi1 which I found on  
  134. file://ftp.uu.net/doc/univeral-docids.PS.Z".
  135.  
  136. I would also suggest that if a document has a unique registered name  
  137. then it should certainly contain that name, so that if you find it  
  138. some otherway, you can refer to it (make links to it) by its official  
  139. name.
  140.  
  141. > That's all
  142. > /John
  143.  
  144. Good points -- thanks for the input...I think more needs to go in  
  145. about registered unique names in the document.
  146.  
  147.     Tim BL
  148.  
  149.  
  150.  
  151.